وفقی سازی الگوریتم نزدیکترین همسایه برای دسته بندی داده های جریانی
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
- author محمد جواد زمردیان
- adviser منصور ذوالقدری جهرمی اقبال منصوری
- Number of pages: First 15 pages
- publication year 1390
abstract
امروزه در بسیاری از کاربرد ها، جریان داده به سرعت و در حجم زیاد تولید می شود. یکی از روش های با اهمیت در کاوش داده، دسته بندی آن است. از چالش های مهم دسته بندی جریان داده، تغییر مفهوم داده با گذشت زمان است که نیاز به، به روز رسانی مدل دسته بندی را مطرح می کند. تاکنون بسیاری از روش های سنتی دسته بندی داده برای تعامل با جریان داده بهبود داده شده اند. یکی از این الگوریتم های سنتی یادگیری، الگوریتم نزدیکترین همسایه است که یکی از الگوریتم های جذاب حوزه داده کاوی است. الگوریتم نزدیکترین همسایه با توجه به مکانیزم ساده تصمیم گیری در تحقیقات گذشته بسیار مورد توجه قرار گرفته است. این الگوریتم برای دسته بندی داده های جریانی با مشکلاتی مواجه خواهد شد که یکی از این مشکلات حجم نمونه ها است. ضمنا تعیین تعداد همسایه ها نیز برای تصمیم گیری این الگوریتم چالش برانگیز است. در این رساله دسته بندی جدیدی مبتنی بر الگوریتم نزدیکترین همسایه پیشنهاد شده است. مدل افزایشی این دسته بندی کننده، برای دسته بندی جریان داده بکار رفته است. سرعت مناسب یادگیری، انعطاف پذیری در زمان پاسخ و پایداری در برابر اغتشاش از مزایای این روش افزایشی هستند. دقت روش پیشنهادی با روش-های شناخته شده در این حوزه روی مجموعه داده های استاندارد واقعی و مصنوعی مقایسه شده است. نتایج بدست آمده حاکی از بهبود دقت، زمان و حافظه در روش افزایشی پیشنهادی است
similar resources
ارزیابی عملکرد رهیافت توسعه یافتهی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه
مولدهای هواشناسی (Weather Generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافتهاند. الگوریتمهای متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شدهاند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی دادهها در س...
full textارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...
full textبهینه سازی گروه ذرات به روی پارامترهای کرنل و k نزدیکترین همسایه برای مسائل دسته بندی
در این پایان نامه یک روش حل مسائل دسته بندی ارائه می شود. کرنلها در روشهای حل مسائل دسته بندی کاربرد بسیاری دارند. با استفاده از کرنل، داده ها به فضایی با ابعاد بالاتر انتقال داده می شوند. به طور ایده آل انتظار می رود که در این فضا داده های مشابه در کنار یکدیگر قرار بگیرند. نو آوری این پایان نامه در به کار گرفتن روش دسته بندی k نزدیکترین همسایه در این فضا است. این عمل از نظر تئوری عملکرد مناس...
سیستم های دسته بندی فازی برای داده های جریانی
سیستم های خودگستر فازی روش هایی قدرتمند در جهت دسته بندی جریان های داده می باشند. در این سیستم ها، قوانین فازی به صورت خودکار تولید، به روز رسانی و حذف می گردند. با این حال، الگوریتم های معرفی شده تا این زمان نمی توانند به خوبی با مشکلات تغییر ناگهانی و تغییر تدریجی در مفهوم داده ها مقابله نماید. در این پایان نامه دو روش خودگستر آن لاین جهت دسته بندی جریان های داده معرفی شده اند، که بر خلاف روش...
15 صفحه اولدسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها
در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...
full textارزیابی عملکرد رهیافت توسعه یافته ی نزدیکترین همسایه در شبیه سازی داده های هواشناسی روزانه
مولدهای هواشناسی (weather generators) با هدف تطویل سری اطلاعات انواع متغیرهای وضع هوا اعم از بارش، دما و رطوبت نسبی، برای ارتقاءِ فهم و درک از عملکرد هر سیستمی که اقلیم عامل تاثیرگذار بر آن باشد، توسعه یافته اند. الگوریتم های متفاوتی از این مولدها در دو نوع کلی پارامتری و ناپارامتری تا به امروز ارائه شده اند. در این مطالعه کارایی مولد ناپارامتری k نزدیکترین همسایه با قابلیت برونیابی داده ها در س...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023